ByteScout PDF Extractor SDK

Software kuvakaappaus:
ByteScout PDF Extractor SDK
Ohjelmiston tiedot:
Versio: 9.0.0.3079 Päivitetty
Lähetyksen päivämäärä: 15 Aug 18
Kehittäjä: ByteScout
Lupa: Shareware
Hinta: 10.00 $
Suosio: 193
Koko: 596 Kb

Rating: 3.3/5 (Total Votes: 4)


        PDF Extractor SDK Windows-ohjelmistokehittäjille: PDF-teksti, PDF XML, PDF-tiedostot, PDF-tiedoston lukeminen, PDF CSV Excel.

Bytescout PDF Extractor SDK mahdollistaa muuntaa PDF jotta kirjoitus, PDF XML, PDF CSV, poimia kuvia PDF, tietoonsa PDF-tiedostot .NET ja ActiveX rajapintoja ilman erillistä ohjelmistoa.


Edut:
 muuntaa PDF-tekstin tavalliseksi tekstiksi (ja se voi seurata sarakkeita, jos muunat sanomalehteä PDF-muodossa) - mukaan lukien näkymätön tekstin poisto;
 muuntaa taulukot PDF: ksi Exceliksi (CSV) lukemalla soluja tietystä suorakulmasta;
 muuntaa taulukot PDF-muotoon XML-tiedostoihin;
 otat PDF-tiedoston metatiedot (otsikko, tekijä, kuvaus) ja saavat muita tietoja tiedostosta (sivumäärä, salattu tai ei);
 otat upotetut kuvat PDF-dokumentilta (ASP.NET, VB.NET, C #, VB6 ja VBScript);
 DocumentMerger- ja DocumentSplitter-rajapinnat ja -luokat yhdistää ja jakaa PDF-dokumentteja;
ei edellytä Adobe Readerin tai muun PDF-lukijaohjelmiston asentamista;
 tarjoaa .NET- ja ActiveX-rajapinnat;
 tehty 100% onnistuneella C # -koodilla.
    

Uutta tässä julkaisussa:

Versio 9.0.0.3079: Lisäsisällön suodattaminen fontin nimen, kirjasimen koon ja värin mukaan.
Päivitetty OCR-moottori uusimpaan versioon. Päivitä kielitiedostot tessdata-kansiosta.
Parannettu tekstinpoisto, rivien ryhmittely taulukkotietoihin, suorituskyky, XFA-lomakkeiden poisto, TableDetector, kiinteät PDF-jäsentämisongelmat.

Uutta versiossa 8.7.0.2980:

Lisätyn sisällön suodatus fontin nimen, kirjasimen koon ja värin mukaan.
Päivitetty OCR-moottori uusimpaan versioon. Päivitä kielitiedostot tessdata-kansiosta.
Parannettu tekstinpoisto, rivien ryhmittely taulukkotietoihin, suorituskyky, XFA-lomakkeiden poisto, TableDetector, kiinteät PDF-jäsentämisongelmat.

Uutta versiossa 8.6.0.2911:

Lisätyn sisällön suodatus fontin nimen, kirjasimen koon ja värin mukaan.
Päivitetty OCR-moottori uusimpaan versioon. Päivitä kielitiedostot tessdata-kansiosta.
Parannettu tekstinpoisto, rivien ryhmittely taulukkotietoihin, suorituskyky, XFA-lomakkeiden poisto, TableDetector, kiinteät PDF-jäsentämisongelmat.

Uutta versiossa 8.2.0.2699:

Versio 8.2.0.2699 voi sisältää määrittelemättömiä päivityksiä, parannuksia tai virheenkorjauksia.

Uutta versio 8.0.0.2528:

  • Lisäsisällön suodattaminen fontin nimen, kirjasimen koon ja värin mukaan.
  • Päivitetty OCR-moottori uusimpaan versioon. Päivitä kielitiedostot "tessdata" -kansiosta.
  • Parannettu tekstin poisto.
  • Parannetut rivit ryhmitellään taulukkotietoihin.
  • Parannettu suorituskyky.
  • Parannettu XFA-lomakkeiden poisto.
  • Parannettu taulukkotunnistin.
  • Kiinteät PDF-jäsentämisongelmat.
  • Kiinteät JBIG-kuvien dekoodaus.
  • ImageExtractor: kiinteä sivua kohti otettu kuva.
  • MultimediaExtractor: kiinteä kopio upotetulle MPEG-äänelle.
  • TextExtractor: Kiinteä ei-aktiivinen RemoveHyphenation-ominaisuus.
  • Uutta versiossa 7.0.0.2474:

    Versio 7.0.0.2474:

    • lisäsi uuden DocumentPrinter-apuohjelman luokka, joka mahdollistaa PDF-dokumenttien tulostamisen hiljaisesti (ilman käyttäjän valintaikkunoita)
    • lisäsi uuden JSONExtractor-luokan
    • lisäsi ohittaa DocumentSplitter.Split () -menetelmän, jonka avulla voidaan määrittää generoidut tiedostot
    • kiinteä monisäikeinen virhe DocumentSplitter-ohjelmassa
    • tableDetector kunnioittaa nyt SetExtractionArea () -menetelmällä määritettyä uuttoaluetta
    • uudet ominaisuudet uuttamoluokissa: ExtractionColumns - sisältää havaittujen sarakkeiden koordinaatit; CustomExtractionColumns - voit ohittaa sarakkeen tunnistuksen
    • GetPageRect * -menetelmät eivät ottanut sivunkierron huomioon.
      Kiinteä bugi asentimessa, joka aiheutti joitain aiempaan asennukseen liittyviä tiedostoja, häiritsi päivityksiä
    • uudistanut rekisteröinnin tarkistuksen. Nyt kirjasto ei heitä poikkeusta, mutta työskentelee demo-tilassa, jos menetät väärän RegistrationNey- ja RegistrationKey-koodin
    • PDF Multitool: Lisätty viimeisimmän asiakirjaluettelon "Avaa PDF-dokumentti" -painiketta
    • PDF Multitool: Valintaa voidaan muuttaa nyt
    • PDF Multitool: Lisätty JSON-ominaisuuden lisäys
    • PDF Multitool: parannettu taulukkoilmaisimen käyttöliittymä
    • PDF Multitool: huomattavasti parannettu fonttien esittämisen laatu
    • PDF Multitool: Lisätty virheenkorjausvaihtoehto "Näytä havaitut ekstraktio-sarakkeet" kontekstivalikkoon näyttääksesi havaitut sarakkeet nykyisellä sivulla. Näkyy näkyviksi vasta sen jälkeen, kun olet suorittanut uutiskirjeen nykyistä näytettyä sivua vastaan
    • PDF Multitool: Kiinteä fonttien esittämisen ongelma 32-bittisissä Windows-käyttöjärjestelmissä
    • muut vähäiset parannukset ja virheenkorjaukset

    Uutta version 6.30.0.2421:

    Version 6.30.0.2421:

    • Lisätty TextComparer-apuohjelma-luokka (saatavilla vain .NET 4.0-kokoonpanoissa), jonka avulla voidaan verrata tekstiä kahteen PDF-dokumenttiin ja luoda raportti.
    • Parannettu ICC-väriprofiilien tuki.
    • Sulautettujen kirjasimien liittäminen.
    • Parannettu liiteExtractor.
    • Kiinteä XMLExtractor.SaveXMLToStream () -menetelmä.
    • Kiinteä kopioitu tekstinkopiointi käytettäessä OCRCacheMode.WholePage-vaihtoehtoa.
    • Muut virheenkorjaukset ja parannukset.

    Uutta versiossa 6.20.2354:

    Versio 6.20.2354:

    • PDF Tekstiin, PDF-tiedostoon CSV, PDF XML-toimintoihin parannettu
    • Uutta uutistoimintoa, Audio-esimerkkien poisto
    • CSV- ja XML-poistoimijat paranivat taulukot, joissa on tyhjiä sarakkeita
    • uusi MultimediaExtractor video- ja äänitiedostojen poistamiseen PDF-tiedostoista
    • uusi ominaisuus PageDataCaching
    • uusi "MemoryCareProcessingOfHugeFiles" esimerkki
    • kiinteä nolla poikkeus yrittäessäsi luovuttaa jo luovutettuja sivuja
    • XLSExtractor: parantaa fonttien tukea
    • SkipInvisibleText ohittaa leikattua tekstiä (joka ei ole näkyvissä)
    • tekstin tulosteiden esitys paranee
    • XFDF Extractor: lisätään tukea valintaruuduille
    • Kuvatuotos parani tukemaan useampia alimuotoja
    • Unicode-tekstinkäsittely parani

    Uutta versio 6.11.2149:

    Versio 6.11.2149:

    • Eräajankäsittelynäytteet päivittyvät osoittamaan Reset () -menetelmän käyttöä
    • C ++-lähdekoodin näyte lisätään Pages Extraction -ohjelmaan
    • DocumentMerger lisää Merge2 (inputfile1, inputfile2, outputfile) -menetelmän yhdistämään 2 tiedostoa
    • XLS Extractor pienet bugikorjaukset
    • PDF Multitool mahdollistaa nyt tekstin, kuvan, vektorin kerrosten ottamisen / poistamisen käytöstä, lisää tekstiasetusten lisäasetuksia
    • XML, CSV, taulukon poistaminen parantaa taulukkojen tukemista emtpry-solujen sisällä sarakkeissa
    • .ExtractShadowLikeText-ominaisuus parantunut: paremman suodatuksen varjotyyppiseen tekstiin

    Uutta versio 6.10.2136:

    Versio 6.10.2136:

    • PDF XML: ään, PDF: hen CSV: lle, PDF: lle Tekstitoiminto parani
    • PDF-tiedoston XLS-komentorivin lisäys (vbscriptin perusteella)
    • PDF HTML SDK: ssa lisää uuden .DetectHyperLinks-ominaisuuden (TRUE oletusarvoisesti) automaattisten linkkien havaitsemiseen tekstissä
    • uusi SearchablePDFMaker (saatavilla PRO-lisensseille) PDF muuntamiseen PDF-tiedostoiksi
    • uusia ominaisuuksia liesituulettimissa: ConsiderFontNames, ConsiderFontSizes, ConsiderFontColors, ConsiderVerticalBorders CFG-tiedostoissa
    • otsikon sarakkeiden havaitseminen (kun AutoAlighHeaderToColumns = true) parannettu
    • .DetectLinesInsteadOfParagraphs korvataan uudella .LineGroupingMode-menetelmällä, jolla hallitaan, miten rivit sulautuvat kappaleisiin
    • TÄRKEÄÄ! PDF-tiedostoon XML korjaa pitkäaikaisen virhekoodin tekstikohteiden Y-koordinaatilla (osoitti vasemmalle vasemmalle vasemmalta ylhäällä)
    • .TableXMinIntersectionRequiredInPercents ja .TableYMinIntersectionRequiredInPercents ominaisuudet lisätty
    • Lisättiin C + + lähdekoodin näyte
    • XML Extractor korjaa puuttuvat tyhjät sarakkeet PreserveFormatting = true-tilassa
    • pienet korjaukset väreissä joissakin PDF-tiedostoissa
    • tuki useille tekstintunnistuskoodille lisättyjä kieliä
    • PDF Multitool GUI: Lisää Kopioi Leikepöydälle -painikkeeksi TXT-, CSV-, XML- ja rasterisoitinvalintaikkunat
    • XLSExtractor: lisää PageToWorksheet -ominaisuuden ottamaan käyttöön / poistamaan käytöstä erilliset laskentataulukot sivua kohti
    • uusi .TextEncodingCodePage-ominaisuus
    • PDFViewerControl: lisää ValidateContextMenu-ohjelman, jonka avulla käyttäjä voi lisätä mukautettuja kohteita kontekstivalikkoon
    • PDF Viewer -ohjaus: lisää ominaisuuksia ShowTextObjects, ShowImageObjects, ShowVectorObjects
    • XMLExtractor lisää nyt tunnistetun tekstin "OCRConfidence" -määritteen
    • PDF / A-tarkastustoiminto (beta)
    • Parannetaan valvontaa ja tekstin tarkistamista ja yhdenmukaistamista alkuperäisen asettelun mukaisesti. Kysymys johtui Y-koordinaattien siirtämisestä hallintalaitteissa jäsentämisen aikana: se oli väärä. Oikea tapa on shif ...
    • XML Extractor päivitetty: nyt tuottaa CONTROL-tunnistetta valintaruuduille ja tekstikentille
    • muutettiin nykyisen hakemiston avulla temp-hakemistoon
    • valintaruutuja, radiolaatikoita, muokkauslaatikoita, yhdistelmäobotteja tuetaan paremmin
    • antaa nyt osittaisia ​​luottamussoittoja

    Uutta versiossa 5.80.1781:

    Versio 5.80.1781:

    • PDF XML: ään, PDF: stä CSV: ään, PDF: stä tekstitoimintoihin päivitetty
    • OCRMode tarjoaa nyt 9 tilaa
    • .DetectLineInsteadOfParagraph nyt toimii paljon paremmin. Aseta se vääriksi kaapata monilinjaiset tekstit taulukon soluihin!
    • PDF-hallintatuki parani
    • FDF- ja XFDF-tietojen poisto

    Uutta versiossa 5.10.1747:

    Versio 5.10.1747:

    • PDF XML: ään, PDF: stä CSV: ään, PDF: n tekstitoimintoihin parannettu
    • tukee tekstinpoistoa tekstinhallinnasta
    • XML-erotin lisää fonttityyliä, kokoa, nimeä ja tekstikoordinaatteja tunnisteiksi
    • Lisätty ASP.NET näyte OCR-käytölle
    • uusi ominaisuus OCRLanguageDataFolder määrittää "tessdata" -kansion sijainnin
    • parannettu PDF-tiedostojen tuki
    • parantaa käännetyn tekstin tukea
    • päivitetyt lähdekoodinäytteet
    • päivitetty dokumentaatio
    • pienet parannukset ja korjaukset

    Uutta versiossa 5.00.1626:

    Versio 5.00.1626:

    • OCR (tekstistä kuvista) -toiminto lisätty: nyt voit poimia tekstiä upotetuista kuvista ja korjata vioittuneen tekstin
    • Kiinteä CSV- ja XML-poistoilmoitus puuttuu viimeisistä sarakkeista joidenkin asetusten kanssa
    • Parannettu tuki vahingoittuneille PDF-tiedostoille
    • Useita tekstinsyöttöhakemistoja on nyt tuettu
    • voi nyt etsiä tekstiä yhdysmerkeillä ja eri riveillä: katso uusi lähdekoodin näyte Etsi teksti kahtena
    • uusi ominaisuus .RTLTextAutoDetectionEnabled (oletuksena vääriä) autojen havaitsemiseen RTL-kielillä
    • PDF-katseluohjelman käyttöliittymä on parantunut
    • pienet parannukset ja korjaukset

      Vaatimukset :

      Vähimmäisvaatimukset strong>:

      Nag-näyttö, vesileima lähtöön

    Tuetut käyttöjärjestelmät

    Vastaavia ohjelmistoja

    Muu ohjelmistojen kehittäjä ByteScout

    Kommentit ByteScout PDF Extractor SDK

    Kommentteja ei löytynyt
    Lisää kommentti
    Ota kuvia!